Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
長谷川 雄太; 小野寺 直幸; 井戸村 泰宏
no journal, ,
局所細分化格子ボルツマン法の計算コードにおけるメモリ使用量削減および通信高速化を目的として、CUDAのUnified memoryを用いたノード内複数GPU実装を試行した。等間隔格子を用いたマイクロベンチマークテストでは、3次元拡散方程式において弱スケーリング96.4%および強スケーリング94.6%の並列化効率、ならびに、D3Q27格子ボルツマン法において弱スケーリング99.3%および強スケーリング56.5%の並列化効率を得た。局所細分化格子ボルツマン法においては、Flat MPI実装に比べてメモリ使用量を25.5%削減したが、並列化効率が9.0%と極めて低くなった。